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Définition d'un Processeur 

o Le processeur (CPU: Central Processing Unit) est un composant qui exécute 
des instructions séquentiellement (programme) a partir de données 

o II possède généralement : Unité de calcul (UAL) + Unité de commande + 
Registres + Horloge + Mémoire cache 




Composition d'un Processeur 



Composition d'un Processeur (l) 

Les parties essentielles d'un processeur sont : 

o Unité Arithmétique et Logique (UAL): prend en charge les calculs 
arithmétiques et logiques élémentaires 

o Unité de contrôle: Unité qui coordonne le fonctionnement des autres 
éléments dans le but d'exécuter une séquence d'instructions. Constituée de 
plusieurs éléments : 

• Registre d'Instruction (RI) : reçoit le code de la prochaine instruction à 
exécuter 

Décodeur : détermine l'opération à exécuter à partir du code de 
l'instruction 

• Horloge : permet de synchroniser les différents éléments du processeur 

• Compteur Ordinal (CO) : registre contenant l'adresse du mot mémoire 
stockant le code de la prochaine instruction 

• Séquenceur : Automate générant les signaux de commande contrôlant 
les différentes unités. Il existe 2 façons de réaliser cet automate : 
séquenceur câblé ou un séquenceur microprogramme 




Composition d'un Processeur (2) 



o Registres: sont des mémoires de petite taille (quelques octets). L'UAL est 
capable de manipuler leurs contenus à chaque cycle de l'horloge 

o Horloge 

• Synchronise toutes les actions d'un système embarqué 

• Présente uniquement dans les processeurs synchrones 

• Définit le cycle de base : cycle machine 

• Le temps d'exécution d'une instruction n'est généralement pas égal au cycle 
machine, car il faut plusieurs cycles machine pour pouvoir séquentiellement 
récupérer l'instruction, la décoder et récupérer les données qu'elle doit traiter 

• Exemple: Sur les microcontrôleurs PIC, il faut 4 cycles d'horloge (machine) pour 
exécuter une instruction 

o Unité d'entrée-sortie 

• Prend en charge la communication avec la mémoire de système 

• Assure la transmission des ordres destinés à piloter quelques processeurs 
spécialisés 

• Permettant au processeur d'accéder aux périphériques de système 




Composition d'un Processeur: Autres Eléments 



Les processeurs actuels intègrent également des éléments plus complexes : 

o Plusieurs UAL: Ce qui permet de traiter plusieurs instructions en même 
temps. Chaque UAL pouvant exécuter une instruction indépendamment de 
l'autre 

o Un pipeline permet de découper temporellement les traitements à 
éffectuer 

o Une unité de calcul en virgule flottante (Floating Point Unit - FPU), 
qui permet d'accélérer les calculs sur des nombres réels codés en virgule 
flottante (selon le format défini par IEEE754) 

o La mémoire cache 

• Permet d'accélérer les traitements en diminuant les temps d'accès à la mémoire 

Ces mémoires sont beaucoup plus rapides que la RAM et ralentissent moins le 
CPU 

• Le cache instructions reçoit les prochaines instructions à exécuter, le cache 
données manipule les données 

• Parfois, un seul cache est utilisé pour le code et les données 

• Plusieurs niveaux de caches peuvent coexister, on les désigne souvent sous les^— 
noms de Ll, L2, L3 ou L4 m 



Les Registres 



Un certain nombre de registres sont communs à la plupart des processeurs: 
o Registres de fonctionnement 

• Compteur Ordinal (CO), Registre Instruction (RI)... 

• Accumulateur (utilisé pour stocker les données en cours de traitement 
par rUAL) 

o Registres généraux 

Servent à stocker des valeurs souvent utilisées ou des résultats 
intermédiaires sans passer par la mémoire 

o Registres de pile (SP : Stack Pointer) 

o Registres d'état (PSW : Program Status Word) 

• Ensemble de bits représentant chacun un état particulier (drapeau ou 
flag) 

• C : dépassement de capacité après un calcul de l'ALU 

• Z : résultat de l'opération est égal a 0 




Exemple d'un Processeur 
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Types de Bus 



Un processeur possède trois types de bus : 

o Un bus de données: définit la taille des données pour les entrées/sorties, dont les 
accès à la mémoire 

o Un bus d'adresse permet, lors d'une lecture ou une écriture, d'envoyer l'adresse où 
elle s'effectue 

o Un bus de contrôle permet la gestion du matériel, via les interruptions 
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Architecture, Classification & Opérations d'un Processeur 




Classification des Processeurs 



Un processeur est défini par : 
o Son architecture 

• Son jeu d'instructions (ISA, Instructions Set Architecture) 

• La largeur de ses registres internes de manipulation de données (8, 16, 
32, 64, 128) bits et leurs utilisations 

• Les spécifications des entrées/sorties, de l'accès à la mémoire, etc. 
o Ses caractéristiques 

• La cadence de son horloge exprimée en MHz ou GHz 

• Sa finesse de gravure exprimée en nm (nanomètres) — la technologie de 
fabrication 

• Le nombre de noyaux de calcul (cœurs) 
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Classification des Architectures 



On classe les architectures en plusieurs grandes familles : 

o CISC (Complex Instruction Set Computer): Choix d'instructions aussi 
proches que possible d'un langage de haut niveau. Le jeu d'instructions 
comporte souvent de nombreuses instructions complexes qui seront 
réalisées en plusieurs cycles 

• Exemples : x86 (Intel et AMD), Motorola 680x0 

o RISC (Reduced Instruction Set Computer): Choix d'instructions plus 
simples. Chacune de ces instructions est censée être exécutée en un seul 
cycle. L'architecture propose en général un nombre important de registres 
généraux 

• Exemples : SPARC, PowerPC, MIPS, ARM 

o Architecture VLIW (Very Long Instruction Word): Ce concept fait reposer 
une partie de la gestion du pipeline sur le compilateur : le processeur reçoit 
des instructions longues qui regroupent plusieurs instructions plus simples 

o DSP (Digital Signal Processor): sont des processeurs spécialisés pour les 
calculs liés au traitement de signaux 

o Un processeur softcore est un « circuit logique programmable » et n'a plus^ 
du tout de fonction pré-câblée m 



Type d'Architecture: Harvard Vs Von Neuman 

Liaison CPU / Mémoire (Programme / Données) 

o La suite d'instructions à exécuter est contenue dans une partie de la 

mémoire nommée mémoire-programme. Les données sur lesquelles opère le 
processeur sont stockées dans la partie mémoire-données. 
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Architecture de type Han/arcl 
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Les opérations du Processeur 



o Le rôle fondamental de la plupart des processeurs est d'exécuter une série 
d'instructions stockées appelées « programme » 

o Les instructions et les données transmises au processeur sont exprimées en 
mots binaires (code machine). Elles sont généralement stockées dans la 
mémoire. Le séquenceur ordonne la lecture du contenu de la mémoire 

o Le langage le plus proche du code machine appelé langage assembleur. 
Toutefois, l'informatique à développé toute une série de langages, dits de « 
haut niveau » (comme le Pascal, C, C++, Fortran, Ada, etc), destinés à 
simplifier l'écriture des programmes 

o Le programme est représenté par une série d'instructions qui réalisent des 
opérations en liaison avec la mémoire vive (RAM). Il y a quatre étapes que 
presque toutes les architectures utilisent : 

• fetch - recherche de l'instruction 

• décode - décodage de l'instruction (opération et opérandes) 
exécute - exécution de l'opération 

• writeback - écriture du résultat 

e 



Vitesse de Traitement 



o La vitesse de traitement d'un processeur est exprimée en MIPS (million 
d'instructions par seconde) ou en mégaFLOPS (millions de floating-point 
opérations per second) pour la partie virgule flottante (FPU) 

o Les processeurs sont basés sur différentes architectures et techniques de 
parallélisation des traitements qui ne permettent plus de déterminer 
simplement leurs performances 

o Des programmes spécifiques d'évaluation des performances (benchmarks) 
ont été mis au point pour obtenir des comparatifs des temps d'exécution de 
programmes réels: dhrystone, cyclesoak, lmbench, ... 
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Exemple: Le Processeur SH-4 



© 



Le Core SH4: Schéma 



Le SuperH est une famille de processeurs, conçu à la base par Hitachi. L'architecture 
des SuperH est de type RISC. Ils sont principalement utilisés dans les systèmes 
embarqués 
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Les registres de SH-4 



Type 


r\egisiers 


Initial value 3 


General registers 


R0_B AN K0-R7_B AN KO , 
R0_BANK1-R7_BAN K1, 
R8-R15 


Undefined 


Control registers 


SR 


MD bit = 1 , RB bit = 1 , BL bit = 1 , FD bit = 0, I3-I0 
= 1111 (OxF), reserved bits = 0, others undefined 


GBR, SSR, SPC, SGR, 
DBR 


Undefined 


VBR 


0x00000000 


System registers 


MACH, MACL, PR, FPUL 


Undefined 


PC 


0XA0000000 


FPSCR 


0x00040001 


Floating-point reg- 
isters 


FR0-FR15, XF0-XF15 


Undefined 
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Mémoires Caches de SH-4 



Item 


Instruction cache 


Operand cache 


Capacity 


8-kbyte cache 


16-kbyte cache or 8-kbyte 
cache + 8-kbyte RAM 


Type 


Direct mapping 


Direct mapping 


Line size 


32bytes 


32 bytes 



Name 


Abbreviation 


R/W 


Initial 
value 3 


P4 

address b 


Area 7 
address b 


Access 
size 


Cache central 
register 


CCR 


R/W 


0x0000 0000 


OxFFOO 00 1C 


0x1F00 001C 


32 


Queue address 
control register 0 


QACRO 


R/W 


Undefined 


OxFFOO 0038 


0x1 F00 0038 


32 


Queue address 
control register 1 


QACR1 


R/W 


Undefined 


OxFFOO 003C 


0X1F00 003C 


32 
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SH-4: Jeu d'Instructions 

Instruction: 

o Opération élémentaire qu'un programme demande à un processeur 
d'effectuer 

o Les instructions sont codées en binaire. Un champ de l'instruction appelé 
code opération ou opcode désigne l'opération à éffectuer 

o Puisque sa valeur numérique n'a pas de sens, le programmeur utilise une 
abréviation désignant le code opération fourni par le langage assembleur 
pour ce processeur 

Jeu d'instructions (Sh4) [instruction de taille 2 bytes]: 

o Transfert: 39 instructions (MOV, SWAP, ...) 
o Arithmétique: 33 instructions (ADD, CMP, DIV, ...) 
o Logique: 14 instructions (AND, NOT, XOR, ...) 
o Décalage: 16 instructions 
o Branchement: 11 instructions 
o Contrôle de système: 57 instructions 
o Virgule flottante (simple précision): 30 instructions 
o Virgule flottante (double précision): 13 instructions 
o Virgule flottante (Contrôle): 8 instructions 




Exemples d'Instructions (l) 

o ADDRm, Rn 

Faire l'addition des 2 registres Rm et Rn et placer le résultat dans le registre Rn 



ADD Rm, Rn 
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- SignExtend 32 (R T J; 


















op2 < 


- SignExtend 3 2(R n ); 


















op2 < 


- op2 * opi; 




















- Regfster(op2); 



















o ADD #imm, Rn 

Faire l'addition du registre Rn et l'octet (s) et placer le résultat dans le registre Rn 



ADD #imm, Rn 
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imm SignExlendg(s); 














op2 SignEKtend 3 2(R n ); 














op2 <— op2 + imm; 














R n Register(op2); 















Exemples d'Instructions (2) 



o ADDVRm, Rn 

This instruction adds Rm to Rn and places the resuit in Rn. The T-bit is set to 1 if the 
addition resuit is outside the 32-bit signed range, otherwise the T-bit is set to 0. 



ADDV Rm, Rn 
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11 
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1111 



opi <- SignExtend 32(^1): 




op2 SignExtenrî 3 2(R ri ); 




op2 <é- op2 +■ opi; 




t <- INT ({op2 < (- 2 31 )) OR (op2 > 2 31 )); 


R n Register(op2); 




T ^ Bit(t); 
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Exemples d'Instructions (3) 

o ANDRm, Rn 

This instruction performs bitwise AND of Rm with Rn and places the resuit in Rn. 



AND Rm, Rn 
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opl <r- ZeToExtend3 2 (Rm): 
op2 <- ZeroExterd 32 (Rn); 
op2 <- op2 a op1; 
R n <- Register(op2); 



o AND #imm, RO 

This instruction performs bitwise AND of RO with the zero-extended 8-bit immédiate 
and places the resuit in RO. 
AND #imm. R0 

11001001 i 

rO ZeroExtend^Ro); 
imm ^— ZeroExtendg(i); 
ri) < — rf) a imrn; 
R 0 Regrster(rO); 



Exemples d'Instructions (4) 



o CLRS 

This instruction clears the S-bit. 

CLRS 



0000000001001000 














S <- Bit(s); 







o CMP/EQRm, Rn 

This instruction sets the T-bit if the value of Rn is equal to the value of Rm, otherwise it 
clears the T-bit. 

CMP/EQ Rm, Rn 
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op1 SignExtend32(R ffl ); 
opZ SignExtend32(Rn); 
t <- (NT (op2 = opl); 
T <- Bit(t); 



Exemples d'Instructions (5) 

o DTRn 

This instruction subtracts 1 from Rn and placed the resuit in Rn. The T-bit is set if the 
resuit is zéro, otherwise the T-bit is cleared. 

DT Rn 



0100 
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00010000 






CXI 


t— co 









opl <r- SSgnExtend 3 2(Rn); 
op1 <- op1 - 1; 
t <r- fNT (opl = 0); 
R n «- Register(opl); 
T - Bit(t); 



Exemples d'Instructions (6) 



o FDIVFRm, FRn 

This floating-point instruction performs a single-precision floating-point division. It 
divides FRn by FRm and places the resuit in FRn. The rounding mode is determined by 
FPSCR.RM. 



FDIV FRm, FRn 



1111 


n 


m 


0011 






CM 






OO 








en 







Available only when PR=0 



sr <- ZeroExîend3 2 (SR)i 

fps ^ ZeroExtend 32 (FPSCR); 

opl <r- FloatValue 32 (FR m ); 

op2 <- FîoatVa]ue 32 (FR^; 

IF (FputsDisabledfsr) AND fsDelaySloîO) 

THROW SL0TFPUD1S; 
IF (FpulsDisafaled(sr)) 

THROW FPUDIS; 
op2, Ips <- FDIV_S(op2, op1, îps); 
IF (FpuEnableV(fps) AND FpuCauseV(lps)) 

THROW FPUEXC, Ips; 
IF (FpuEnableZ(fps) AND FpuCanseZ(fps)) 

THROW FPUEXC, fps; 
IF (FpuCauseE(tps)) 

THROW FPUEXC, Ips; 
IF ((FpuEnabtel(fps) OR FpuEnabfeO(fps)} OR FpuEnabJell(fps)) 

THROW FPUEXC, Ips; 
FR n <- FloatRegister 32 (op2); 
FPSCR <- ZeroExtend 32 (tps); 
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